import urllib.request
from bs4 import BeautifulSoup   #对网页进行提取重要内容

gameType = []
#爬取4399小游戏网站
url = 'http://www.4399.com/'
#请求网址
req = urllib.request.Request(url)
#增加头部信息
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.82 Safari/537.36')
#读取网页内容 编码方式为gbk 此地方有一个坑
html = urllib.request.urlopen(req).read().decode('gbk')
soup = BeautifulSoup(html,features='lxml')
#查询div标签下面class为menu_le的html内容 在进行数据清洗
soup = soup.find('div',{'class':'menu_le'})
#把游戏的各种类型显示出来
soup = soup.find_all('a')
for item in soup:
    gameType.append(item.get_text())

#输出打印所有的游戏类型
print(gameType)